import pandas as pd

"""
导入CSV/txt文件：
    pd.read_csv(filepath_or_buffer, sep=',', header, encoding=None)
        filepath_or_buffer: 字符串、文件路径，也可以是URL链接
        sep：字符串、分隔符
        header：指定作为列名的行，默认是0，如果没有，需指定为None
        encoding:编码
"""
pd.set_option('display.unicode.east_asian_width', True)
csv = pd.read_csv('resources/京东鞋子评论数据.csv', sep=',', header=0, encoding="GBK")
print(csv)

# 导入txt文件
txt = pd.read_csv('resources/rating.txt', sep='\t', header=None, encoding="GBK")
print(txt)

"""
导入HTML网页 -- 只能读取table标签里的内容
    pd.read_html(io, match='', flavor, header, encoding)
        io: 字符串、文件路径，也可以是URL链接，不支持https
        match: 正则表达式
        flavor: 解释器默认为'lxml'
"""
url = 'http://www.espn.com/nba/salaries'
df = pd.DataFrame()  # 创建空的DataFrame对象

# DataFrame添加数据
df = df._append(pd.read_html(url, header=0))
print(df)

# 保存成CSV文件
df.to_csv('NBA_salary.csv', index=False) # 不要索引
